Big Data und die Möglichkeiten der SAS In-Database-Verarbeitung

0

In der heutigen Zeit macht es immer weniger Sinn, gigantische Datenmengen über das Netzwerk in ein Auswertetool zur Analyse zu übertragen. Der Geschwindigkeitsvorteil einer hoch performanten statistischen Analyse von riesigen Datenmengen wird durch die lange Datenübertragung dieser riesigen Datenmengen wieder zunichtegemacht. An diesem Punkt müssen andere Technologien angewendet werden, um diesen Flaschenhals zu umgehen. Warum also nicht die Analyse zu den Daten bringen mittels SAS In-Database-Verarbeitung?

Mit den SAS/ACCESS Schnittstellen ist es schon länger möglich, SQL-Code aus SAS heraus per Pass-Through-Anweisung in Datenbanken auszuführen. Hierbei können auch datenbankspezifische SQL-Anweisungen ausgeführt werden. Die i. d. R. kleinen Ergebnismengen können dann über das Netzwerk zur weiteren Verarbeitung übertragen werden oder verbleiben ebenfalls in der Datenbank.

Mittels SQL-Code lassen sich aber anspruchsvolle analytische Abfragen, wie es mit der SAS Abfragesprache möglich ist, nicht umsetzen. Leider verstehen auch die Datenbanken wiederum kein SAS. Um dennoch den heutigen analytischen Anforderungen im Big-Data-Zeitalter gerecht zu werden, wurde die SAS Abfragesprache zum Data Step 2 oder kurz DS2 weiterentwickelt.

Verschiedene sogenannte „Accelarator“-Schnittstellen stehen von SAS zur Verfügung und werden als „Embedded Process“ in der Datenbank installiert. Der Embedded Process fungiert dabei als Übersetzer zwischen SAS und der Datenbank und ermöglicht so die Ausführung von spezifischen SAS Funktionalitäten direkt in der Datenbank:

Scoring Accelerator: Ausführung von Score-Code
Code Accelerator: Ausführung von DS2-Code
DQ Accelerator: Ausführung von Datenqualitätsfunktionen

Welche SAS Accelerators für welche Datenbanken zur Verfügung stehen, kann der folgenden Tabelle entnommen werden:

R.Storch_Big Data und die Möglichkeiten der SAS In-Database-Verarbeitung_1
Weitere Infos hier

Share

About Author

Ralf Storch

Sr Solutions Architect

Ralf Storch ist Sr Solutions Architect und Data Management Experte bei SAS seit 2001. Als studierter Informatiker arbeitet er schon über 20 Jahren im Bereich der Informationstechnologie. Er betreut und berät Kunden im Banken-, Versicherungs- aber auch Industrieumfeld rund um die Schwerpunktthemen Data Management, Data Quality und Data Governance in Deutschland, Österreich und der Schweiz.

Related Posts

Leave A Reply

Back to Top